中国のAIスタートアップ企業であるDeepSeekは、初回の大規模資金調達を計画しており、約500億元人民元(約74億ドル)を調達する目標としている。資金調達後、同社の評価額は3500〜4000億元人民元になると予想されている。この企業はV3およびR1モデルによって世界中で注目を集め、中国の大規模モデル開発能力への世間の認識を変えてきた。
AIユニコーンDeepSeekが初の外部資金調達を開始、評価額は200億米ドル超を見込む。テンセントやアリババが関心を示す。創業者梁文鋒の定量取引資金に依存してきたが、人材流出対策として株式報酬制度を導入。R1論文著者郭達雅や研究者Wang Bingxuanらの離脱を受け、中核人材の定着を図る。....
DeepSeekは来週、画像・動画・テキスト生成機能を追加したV4大モデルをリリース。2025年1月のR1以来の大型アップデートで、国内低コストオープンソース市場を強化。証券アナリストは、春節期間中の高頻度消費シーンを通じたAI応用の商業化加速を予測。....
2026年ダボス会議で、DeepMind CEOハサビスは、中国AI技術が欧米に迫り、差は約6カ月に縮小したと指摘。国産モデルDeepSeek R1の高性能を高く評価し、シリコンバレーに衝撃を与えたと述べた。....
DeepSeek R1-0528はオープンソースの大規模モデルで、OpenAI o3モデルに匹敵するパフォーマンスを持っています。
DeepSeek R1およびV3モデルに基づくブラウザサイドバーAIツールで、質疑応答、創作、翻訳などの機能を提供します。
DeepSeek-V3/R1推論システムは大規模AIモデルの最適化向けに設計された高性能な分散推論アーキテクチャです。
DeepSeek R1をサポートするAI駆動型のリサーチアシスタントで、検索エンジン、Webクローラー、大規模言語モデルを組み合わせて深層的なリサーチを行います。
Deepseek
$4
入力トークン/百万
$12
出力トークン/百万
128
コンテキスト長
$16
32
Tencent
$0.8
$2
$8
Alibaba
-
$1.6
$1
8
Baidu
64
$100
recursechat
DeepSeek - R1は大規模な強化学習によって訓練された推論モデルで、数学、コード、推論タスクで優れた性能を発揮します。教師付き微調整を必要とせずに、自己検証、反省、長い思考チェーンの生成などの強力な推論能力を示します。
yanmyoaung04
これはUnslothのDeepSeek - R1 - Distill - Llama - 8Bモデルを微調整したネットワークセキュリティ専用バージョンで、ネットワークセキュリティ関連の内容の生成と理解に特化し、脅威インテリジェンスの要約や脆弱性分析などのタスクをサポートします。
nvidia
NVIDIA DeepSeek R1 FP4 v2は、DeepSeek AIのDeepSeek R1モデルに基づいてFP4量子化を行ったテキスト生成モデルで、最適化されたTransformerアーキテクチャを採用しており、商用および非商用用途に使用できます。このモデルはTensorRT Model Optimizerを通じて量子化され、FP8バージョンと比較してディスク容量とGPUメモリの要件が大幅に削減されています。
NVIDIA DeepSeek-R1-0528-FP4 v2はDeepSeek R1 0528モデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用し、自己回帰型言語モデルです。FP4量子化最適化により、ディスク容量とGPUメモリの要求量を削減し、同時に高い推論効率を維持します。
Azzindani
これはインドネシア法律分野に特化して最適化された言語モデルで、DeepSeek - R1 - 0528 - Qwen3 - 8Bをベースに、GRPO方法を使用してインドネシア法律質問と回答データセットで微調整され、法律推論と構造化思考能力の向上に重点を置いています。
NVIDIA DeepSeek-R1-0528-FP4はDeepSeek R1 0528モデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用し、重みと活性化値をFP4データ型に量子化することで、ディスク容量とGPUメモリの要件を大幅に削減し、TensorRT-LLM推論エンジンをサポートして効率的な推論を実現します。
DeepSeek AI社のDeepSeek R1 0528モデルの量子化バージョンで、最適化されたTransformerアーキテクチャに基づく自己回帰型言語モデルで、商用および非商用用途に使用できます。
Sci-fi-vy
DeepSeek-R1-0528はDeepSeek R1シリーズの小バージョンアップグレードモデルで、計算リソースの増加とアルゴリズムの最適化により、推論の深度と能力を大幅に向上させ、数学やプログラミングなどの複数のベンチマークテストで優れた成績を収めています。
cognitivecomputations
DeepSeek R1 0528のAWQ量子化モデルで、vLLMを使用して8基の80GB GPUでフルコンテキスト長で実行可能です。
QuixiAI
DeepSeek-R1-0528-AWQはDeepSeek R1 0528のAWQ量子化バージョンで、量子化技術によりモデルの実行効率を向上させ、コードの問題を修正し、より安定したサービスを提供します。
adamo1139
DeepSeek - R1 - 0528 671Bモデルの4ビットAWQ量子化バージョンで、ハイエンドGPUノードでの使用に適しています。
DeepSeek-R1-0528はDeepSeek R1モデルの小規模なバージョンアップで、計算リソースの増加とアルゴリズムの最適化により、推論能力を大幅に向上させ、数学、プログラミング、一般的な論理などの複数のベンチマーク評価で優れた成績を収めています。
deepseek-ai
DeepSeek R1モデルはマイナーバージョンアップを完了し、現在のバージョンはDeepSeek-R1-0528です。最新の更新では、DeepSeek R1は計算リソースの投入を増やし、トレーニング後の段階でアルゴリズム最適化メカニズムを導入することで、深層推論と推論能力を大幅に向上させました。
ubergarm
DeepSeek - R1T - Chimeraは、ik_llama.cppが提供する高度な量子化方式により、性能を維持しながらメモリ使用量を大幅に削減した高品質の大規模言語モデルです。
Nexesenex
Hexagon Purple V2はSmartracksベースの3段階標準統合モデルで、Deepseek Distill R1、Nemotron、Tuluの能力を統合し、マルチモデル統合により性能を最適化しています。
TorpedoSoftware
DeepSeek - R1 - Distill - Qwen - 14Bをベースに微調整されたRoblox開発専用モデルで、Robloxプラットフォームの知識とLuauプログラミング言語の専門知識を取り入れ、Roblox開発者に専門的なコード生成と問題解決能力を提供します。
qihoo360
Tiny-R1-32B-PreviewはDeepseek-R1-Distill-Qwen-32Bを基にした推論モデルで、数学、コード、科学分野に特化しており、性能はフルバージョンのR1モデルに近いです。
suayptalha
DeepSeek-R1-Distill-Llama-3Bは、Llama-3.2-3Bモデルをベースに、R1-Distill-SFTデータセットを使用してDeepSeek-R1を蒸留したバージョンで、テキスト生成能力を備えています。
NVIDIA DeepSeek R1 FP4モデルは、DeepSeek AIのDeepSeek R1モデルの量子化バージョンで、最適化されたTransformerアーキテクチャを使用した自己回帰型言語モデルです。このモデルは、FP4量子化技術を通じてパラメータのビット数を8ビットから4ビットに減らし、ディスクサイズとGPUメモリ要件を約1.6倍削減すると同時に、高い精度性能を維持します。
DeepSeek R1モデルのFP4量子化バージョン、最適化されたTransformerアーキテクチャで効率的なテキスト生成を実現
Node.jsベースのDeepseek R1言語モデルのMCPサーバー実装で、8192トークンの文脈ウィンドウをサポートし、安定したClaude Desktop統合とモデルパラメータ設定を提供します。
DeepSeek R1の推論エンジンを統合することで、Claudeの複雑なタスク処理能力を強化します
Deepseek R1モデルの思考チェーンを利用して推論を行うMCPサービスツールで、Claude Desktopなどのクライアントで使用できます。
このプロジェクトは、DeepSeek R1の推論エンジンを統合することで、Claudeの複雑なタスク処理能力を強化し、多段階の正確な推論サポートを提供します。
Deepseek R1のMCPサーバー実装で、Node.js環境をサポートし、強力な言語モデル推論サービスを提供します。
ローカルで動作するインテリジェントエージェントシステムで、推論モデルとツール呼び出しモデルを組み合わせています。
Deepseek R1のMCPサーバー実装で、Claude Desktopとの統合をサポートし、強力な言語モデル推論サービスを提供します。
Thoughtful Claudeは、Claudeの推論能力を強化するMCPサーバーで、DeepSeek R1の高度な推論エンジンを統合することで、Claudeに複雑な多段階推論タスクの処理能力を提供します。
DeepSeek MCPサーバーは、DeepSeek R1の高度な推論エンジンを統合することでClaudeの推論能力を強化し、複雑な多段階推論タスクを処理できるようにします。
DeepSeek-Claude MCPサーバーは、DeepSeek R1の高度な推論エンジンを統合することで、Claudeの複雑な推論タスクの処理能力を強化します。
DeepSeek MCPサーバーは、DeepSeek R1の先進的な推論エンジンを統合することでClaudeの推論能力を強化し、複雑な多段階推論タスクを処理できるようにします。
DeepSeek MCP Serverは、DeepSeek R1の高度な推論エンジンを統合することでClaudeの推論能力を強化し、複雑な多段階推論タスクを処理できるようにします。
このプロジェクトはDeepSeek R1の推論エンジンを統合することで、Claudeの複雑な推論タスクの処理能力を強化し、効率的で正確な多段階推論の解決策を提供します。
DeepSeek R1とClaudeを組み合わせた認知アーキテクチャプロジェクトで、R1による高度な推論計画とClaudeによる具体的な分析の実行を通じて、多段階の論理推論と構造化された思考処理を実現します。
Model Context Protocol (MCP)に基づくサーバーで、DeepSeek - R1の推論機能にアクセスでき、非推論モデルが強化された思考によってより良い応答を生成できるようにします。
DeepSeek R1の推論とClaude 3.5の生成能力を結合したMCPサービス